Approximability of cycle covers and smoothed analysis of binary search trees
نویسنده
چکیده
Der Beitrag enthält eine Zusammenfassung der Dissertation ”Approximability of Cycle Covers and Smoothed Analysis of Binary Search Trees“. Eine Zyklenüberdeckung eines Graphen ist ein Teilgraph, der nur aus Zyklen besteht, so dass jeder Knoten Teil genau eines Zyklus ist. Bei einer L-Zyklenüberdeckung muss zusätzlich die Länge jedes Zyklus in der Menge L liegen. Im ersten Teil der Dissertation wurde die Komplexität und Approximierbarkeit des Problems untersucht, LZyklenüberdeckungen maximalen Gewichts zu berechnen. Es wurden einerseits effiziente Approximationsalgorithmen zur Berechnung von L-Zyklenüberdeckungen entwickelt. Andererseits wurde bewiesen, dass L-Zyklenüberdeckungsprobleme für fast alle Mengen L nicht beliebig gut approximiert werden können. Im zweiten Teil der Dissertation wurde eine Smoothed Analysis der Höhe binärer Suchbäume durchgeführt. Die Smoothed Analysis interpoliert zwischen der WorstCase-Komplexität, die oft zu pessimistisch ist und durch ”pathologische“ Instanzen dominiert wird, und der Average-Case-Komplexität, die oft zu optimistisch ist. 1 Optimierungsprobleme und Approximierbarkeit Eine Spedition soll Waren zu verschiedenen Kunden ausliefern und möchte dies natürlich mit möglichst geringen Fahrtkosten machen. Ein Tourist möchte alle Sehenswürdigkeiten einer Stadt in möglichst kurzer Zeit besuchen. Hinter diesen und ähnlichen Problemen verbergen sich Optimierungsprobleme. Bei beiden Beispielen handelt es sich um das Travelling Salesman Problem (TSP), wohl eines bekanntesten Optimierungsprobleme: Eine Instanz des TSP ist ein vollständiger, kantengewichteter Graph, und das Ziel ist es, eine Rundreise durch den Graphen zu finden, die jeden Knoten genau einmal besucht (Hamiltonscher Zyklus). Leider ist das TSP NP-schwer; unter der Annahme NP 6= P gibt es also keinen effizienten Algorithmus, der kürzeste Rundreisen berechnet. In der Praxis ist es oft aber gar nicht notwendig, die kürzeste Rundreise zu berechnen. In vielen Fällen genügt eine Rundreise, die nur wenig schlechter ist als die optimale. Solche Rundreisen schnell (also in polynomieller Zeit) zu berechnen, ist die Aufgabe von Approximationsalgorithmen. Eine Verallgemeinerung Hamiltonscher Zyklen sind Zyklenüberdeckungen (cycle covers): Eine Zyklenüberdeckung eines Graphen ist eine Menge an Zyklen, so dass jeder Knoten auf genau einem Zyklus liegt. Abbildung 1 zeigt ein Beispiel einer Zyklenüberdeckung. Ausgezeichnete Informatikdissertationen 2005, Lecture Notes in Informatics (a) Ein ungerichteter Graph. (b) Eine Zyklenüberdeckung des Graphen (durchgezogene Kanten). Abbildung 1: Beispiel einer Zyklenüberdeckung. Im Gegensatz zu Hamiltonschen Kreisen können Zyklenüberdeckungen maximalen (oder minimalen) Gewichts effizient berechnet werden. Daher werden Zyklenüberdeckungen oft in Approximationsalgorithmen für das TSP verwendet; tatsächlich basieren die derzeit besten Approximationsalgorithmen für eine ganze Reihe von Varianten des TSP und für verwandte Probleme wie dem Shortest Common Superstring Problem auf der Berechnung von Zyklenüberdeckungen. Im Allgemeinen gilt dabei: Je länger die Zyklen in der berechneten Zyklenüberdeckung sind, desto näher ist die berechnete Lösung am Optimum. Daher möchte man Zyklenüberdeckungen ohne kurze Zyklen berechnen. Es gibt aber auch Approximationsalgorithmen für das TSP, die besonders gute Lösungen liefern, falls die berechneten Zyklenüberdeckungen nur aus Zyklen gerader Länge bestehen. Schließlich basieren Algorithmen zum sogenannten Vehicle Routing Problem auf der Berechnung von Zyklenüberdeckungen, die keine zu langen Zyklen enthalten. Aus diesen Gründen habe ich im ersten Teil meiner Dissertation eingeschränkte Zyklenüberdeckungen untersucht, in denen Zyklen bestimmter Längen von vornherein ausgeschlossen sind: Eine L-Zyklenüberdeckung (L ⊆ N) ist eine Zyklenüberdeckung, in der die Länge jedes Zyklus in der Menge L liegt. Um die Möglichkeiten für Approximationsalgorithmen auszuloten, die auf der Berechnung von Zyklenüberdeckungen basieren, war es das Ziel, diejenigen Mengen L zu charakterisieren, für die L-Zyklenüberdeckungen maximalen (oder minimalen) Gewichts effizient berechnet oder zumindest sehr gut approximiert werden können. 2 Approximierbarkeit von Zyklenüberdeckungen Ist ein Optimierungsproblem NP-schwer, dann können optimale Lösungen für Instanzen dieses Problems nicht effizient berechnet werden, es sei denn, es wäre P = NP. Es ist aber noch nichts darüber gesagt, wie gut optimale Lösungen approximiert werden können. Ein c-Approximationsalgorithmus für ein Optimierungsproblem ist ein Polynomialzeitalgorithmus, der auf Eingabe einer Instanz des Problems stets eine Lösung berechnet, deren Kosten höchstens um einen konstanten Faktor c ≥ 1 von den Kosten einer optimalen Lösung abweichen. Die Klasse APX enthält alle Optimierungsprobleme, für die es einen cApproximationsalgorithmus gibt. Ist ein Optimierungsproblem APX-schwer, dann gibt es eine Konstante ε > 0, so dass dieses Problem nicht mit Faktor 1+ ε approximiert werden kann, es sei denn, es wäre P = NP. In diesem Fall ist also das Berechnen approximativer Lösungen einer bestimmten Güte genauso schwer wie das Finden optimaler Lösungen. Sei L ⊆ U = {3,4,5, . . .}. (In ungerichteten Graphen haben die kürzesten Zyklen die Länge 3.) Dann ist L-UCC das Problem zu entscheiden, ob ein ungerichteter Graph eine L-Zyklenüberdeckung besitzt. Max-L-UCC ist folgendes Optimierungsproblem: Die Eingabe ist ein ungerichteter, vollständiger Graph mit Kantengewichten 0 und 1. Das Ziel ist es, eine L-Zyklenüberdeckung maximalen Gewichts zu finden. Max-W-L-UCC ist definiert wie Max-L-UCC, der einzige Unterschied ist, dass beliebige natürliche Zahlen als Kantengewichte erlaubt sind. Sei nun L ⊆ D = {2,3,4, . . .}. (In gerichteten Graphen sind auch Zyklen der Länge 2 möglich.) Dann sind L-DCC, Max-L-DCC und Max-W-L-DCC genauso definiert wie LUCC, Max-L-UCC bzw. Max-W-L-UCC, abgesehen davon, dass die Instanzen nun gerichtete Graphen sind. Wir definieren L = U \ L im Fall ungerichteter Graphen und L = D \ L für gerichtete Graphen (aus dem Kontext wird klar werden, welcher Fall gerade betrachtet wird). Die Menge L enthält somit die verbotenen Zyklenlängen. Ohne Einschränkung der erlaubten Zyklenlängen können alle Varianten des L-Zyklenüberdeckungsproblems in polynomieller Zeit mit Hilfe von Matching-Algorithmen gelöst werden. Auch das Entscheidungsproblem {3}-UCC (nur Länge 3 ist verboten) ist in P. Hell et al. [2] zeigten, dass L-UCC, und damit auch Max-L-UCC und Max-W-L-UCC, NPschwer ist, falls L 6⊆ {3,4} ist, d.h. falls es eine verbotene Zyklenlänge ` ≥ 5 gibt. MaxW-L-UCC ist bereits NP-schwer, wenn es eine verbotene Zyklenlänge `≥ 4 gibt [2, 7]. Bislang war allerdings kaum etwas über die Komplexität bekannt, L-Zyklenüberdeckungen in gerichteten Graphen zu finden. Des Weiteren war es, abgesehen von einigen Arbeiten zu speziellen Mengen L, unbekannt, wie gut L-Zyklenüberdeckungen approximiert werden können.
منابع مشابه
Probabilistic analysis of the asymmetric digital search trees
In this paper, by applying three functional operators the previous results on the (Poisson) variance of the external profile in digital search trees will be improved. We study the profile built over $n$ binary strings generated by a memoryless source with unequal probabilities of symbols and use a combinatorial approach for studying the Poissonized variance, since the probability distribution o...
متن کاملProfile and Height of Random Binary Search Trees
The purpose of this article is to survey recent results on distributional properties of random binary search trees. In particular we consider the profile and the height.
متن کاملSmoothed Analysis of Binary Search Trees
Binary search trees are one of the most fundamental data structures. While the height of such a tree may be linear in the worst case, the average height with respect to the uniform distribution is only logarithmic. The exact value is one of the best studied problems in average-case complexity. We investigate what happens in between by analysing the smoothed height of binary search trees: Random...
متن کاملSmoothed Analysis of the Height of Binary Search Trees
Binary search trees are one of the most fundamental data structures. While the height of such a tree may be linear in the worst case, the average height with respect to the uniform distribution is only logarithmic. The exact value is one of the best studied problems in average case complexity. We investigate what happens in between by analysing the smoothed height of binary search trees: random...
متن کاملP´olya Urn Models and Connections to Random Trees: A Review
This paper reviews P´olya urn models and their connection to random trees. Basic results are presented, together with proofs that underly the historical evolution of the accompanying thought process. Extensions and generalizations are given according to chronology: • P´olya-Eggenberger’s urn • Bernard Friedman’s urn • Generalized P´olya urns • Extended urn schemes • Invertible urn schemes ...
متن کاملSmoothed Analysis of Binary Search Trees and Quicksort under Additive Noise
Binary search trees are a fundamental data structure and their height plays a key role in the analysis of divide-and-conquer algorithms like quicksort. Their worst-case height is linear; their average height, whose exact value is one of the best-studied problems in average-case complexity, is logarithmic. We analyze their smoothed height under additive noise: An adversary chooses a sequence of ...
متن کامل